Mô hình rasch là gì? Các bài nghiên cứu khoa học liên quan

Mô hình Rasch là một mô hình đo lường trong thống kê, sử dụng để phân tích mối quan hệ giữa khả năng người trả lời và độ khó của từng câu hỏi. Nó thuộc nhóm lý thuyết phản hồi câu hỏi (IRT), đơn giản hóa bằng cách chỉ dùng một tham số cho mỗi mục đo, đảm bảo đo lường khách quan và nhất quán.

Giới thiệu về mô hình Rasch

Mô hình Rasch là một phương pháp thống kê thuộc họ các mô hình phản hồi câu hỏi (Item Response Theory - IRT), dùng để phân tích dữ liệu đo lường trong các lĩnh vực như giáo dục, tâm lý học, khoa học xã hội, và y tế. Mô hình được đặt theo tên của nhà toán học người Đan Mạch Georg Rasch, người đã phát triển mô hình này vào thập niên 1960 nhằm tìm kiếm một công cụ đo lường mang tính khách quan và quy chuẩn trong nghiên cứu khoa học xã hội.

Khác với các mô hình truyền thống trong đo lường giáo dục (như lý thuyết kiểm tra cổ điển - Classical Test Theory), mô hình Rasch không chỉ xem điểm số như tổng hợp của các câu trả lời mà còn đánh giá mối quan hệ xác suất giữa khả năng của cá nhân và độ khó của từng mục đo. Điều này cho phép phân tích dữ liệu một cách tinh vi và chính xác hơn, loại bỏ ảnh hưởng ngẫu nhiên và sai lệch của từng cá nhân hoặc mục đo riêng lẻ.

Mô hình Rasch mang lại các ưu điểm nổi bật:

  • Đánh giá mức độ phù hợp của từng câu hỏi với mô hình lý thuyết thống kê.
  • Xây dựng các thang đo có tính quy chuẩn và so sánh được giữa các nhóm đối tượng.
  • Hỗ trợ kiểm định giả thuyết đo lường và cải thiện chất lượng công cụ khảo sát.

Cấu trúc toán học của mô hình Rasch

Mô hình Rasch nhị phân mô tả xác suất một người có khả năng θn\theta_n trả lời đúng một câu hỏi có độ khó βi\beta_i bằng công thức logistic:

P(Xni=1θn,βi)=eθnβi1+eθnβi P(X_{ni} = 1 | \theta_n, \beta_i) = \frac{e^{\theta_n - \beta_i}}{1 + e^{\theta_n - \beta_i}}

Trong mô hình trên:

  • θn\theta_n: tham số đại diện cho khả năng của người tham gia thứ n
  • βi\beta_i: tham số đại diện cho độ khó của mục câu hỏi i
  • XniX_{ni}: biến quan sát (0 hoặc 1), tương ứng với trả lời sai hoặc đúng
Mô hình giả định rằng xác suất trả lời đúng phụ thuộc duy nhất vào chênh lệch giữa khả năng và độ khó.

Dưới đây là bảng minh họa xác suất trả lời đúng trong một số tình huống khác nhau:

θn\theta_n βi\beta_i θnβi\theta_n - \beta_i Xác suất đúng
0 0 0 0.5
1 0 1 0.73
-1 0 -1 0.27

Điều này cho thấy mô hình Rasch có dạng đối xứng quanh điểm θn=βi\theta_n = \beta_i, nơi xác suất trả lời đúng là 0.5.

Đặc điểm lý thuyết của mô hình Rasch

Điểm nổi bật nhất của mô hình Rasch là nó là một mô hình đơn tham số. Mỗi mục câu hỏi chỉ có duy nhất một tham số là độ khó (βi\beta_i), và không có tham số phân biệt hay đoán mò như trong các mô hình phức tạp hơn (2PL hoặc 3PL). Chính đặc tính này làm cho mô hình có khả năng chuẩn hóa cao và dễ giải thích trong bối cảnh đo lường thực nghiệm.

Một khái niệm trung tâm của mô hình là "tính khách quan riêng phần" (specific objectivity). Điều này có nghĩa là sự khác biệt giữa hai cá nhân về khả năng không phụ thuộc vào tập hợp câu hỏi đã dùng, và ngược lại, sự khác biệt giữa hai câu hỏi về độ khó không phụ thuộc vào người được hỏi. Đây là điều kiện then chốt để các thang đo dựa trên mô hình Rasch được công nhận là đo lường hợp lệ trong khoa học xã hội.

Các đặc điểm cốt lõi của mô hình Rasch:

  • Tính khả chuyển (transitivity) trong đo lường năng lực và độ khó.
  • Tính tuyến tính của thang đo, cho phép áp dụng các phép toán đại số cơ bản.
  • Không phụ thuộc vào phân phối năng lực trong mẫu khảo sát.

So sánh với các mô hình IRT khác

Trong hệ thống IRT, mô hình Rasch được xem là trường hợp đặc biệt đơn giản nhất của mô hình ba tham số (3PL). Các mô hình này lần lượt mở rộng Rasch bằng cách thêm các tham số như:

  • Tham số độ phân biệt (aia_i) trong mô hình 2PL.
  • Tham số đoán mò (cic_i) trong mô hình 3PL.
Mặc dù các mô hình này có thể phù hợp dữ liệu tốt hơn, chúng thường đòi hỏi lượng dữ liệu lớn và dễ bị nhiễu bởi các biến không kiểm soát.

Mô hình Rasch, do đơn giản hơn, lại được ưa chuộng trong các tình huống cần độ tin cậy và khả năng khái quát hóa cao. Theo nghiên cứu tại NCBI, các ứng dụng thực tế như đánh giá kỹ năng lâm sàng, chuẩn hóa bài kiểm tra giáo dục và đo lường chất lượng sống đều cho thấy mô hình Rasch tạo ra kết quả ổn định và có thể lặp lại.

Bảng so sánh các mô hình IRT cơ bản:

Mô hình Tham số Ưu điểm Nhược điểm
Rasch (1PL) Độ khó (βi\beta_i) Đơn giản, dễ diễn giải, khách quan Không linh hoạt bằng 2PL/3PL
2PL Độ khó, độ phân biệt (aia_i) Phù hợp dữ liệu tốt hơn Phức tạp, khó kiểm soát
3PL Độ khó, độ phân biệt, đoán mò (cic_i) Linh hoạt tối đa Dễ bị overfitting, yêu cầu mẫu lớn

Ứng dụng của mô hình Rasch

Mô hình Rasch được ứng dụng rộng rãi trong nhiều lĩnh vực thực tiễn nhờ khả năng đo lường khách quan, đặc biệt là trong giáo dục, y học, đánh giá tâm lý, và nghiên cứu xã hội. Trong giáo dục, Rasch giúp thiết kế và hiệu chuẩn các bài kiểm tra tiêu chuẩn hóa như TOEFL, GRE, hoặc các kỳ thi quốc gia. Thay vì chỉ nhìn điểm tổng, mô hình phân tích từng câu hỏi để xác định độ khó và phát hiện các mục không phù hợp.

Trong y học, Rasch được sử dụng để xây dựng và xác nhận các công cụ đo lường chất lượng cuộc sống, đánh giá đau, rối loạn tâm thần và các triệu chứng bệnh lý. Ví dụ, mô hình được áp dụng trong phát triển bộ câu hỏi PROMIS của NIH nhằm đo lường trải nghiệm bệnh nhân.

Các ứng dụng phổ biến của mô hình Rasch:

  • Chuẩn hóa bài thi năng lực và đánh giá học tập
  • Phát triển thang đo tâm lý như trầm cảm, lo âu
  • Kiểm định độ tin cậy của bảng hỏi khảo sát
  • Đánh giá kỹ năng chuyên môn trong y học lâm sàng

Yêu cầu và giả định của mô hình Rasch

Để mô hình Rasch mang lại kết quả đáng tin cậy, cần đảm bảo một số giả định lý thuyết. Thứ nhất là giả định về tính đơn chiều (unidimensionality), tức là tất cả các mục đo đều đánh giá cùng một đặc điểm hoặc khả năng. Nếu có nhiều chiều tiềm ẩn, mô hình sẽ bị sai lệch.

Thứ hai là giả định về tính độc lập cục bộ (local independence): mỗi câu hỏi phải độc lập về mặt thống kê với các câu hỏi khác, với điều kiện đã biết khả năng của người làm bài. Thứ ba, phản hồi phải tuân theo hàm logistic — điều này loại bỏ các hình thức đo lường phi tuyến hoặc bị ảnh hưởng bởi đoán mò.

Một số chỉ số thường dùng để kiểm tra các giả định này gồm:

  • INFIT: nhạy với lỗi xảy ra ở các câu hỏi phù hợp với khả năng người trả lời
  • OUTFIT: nhạy với lỗi ở các câu hỏi quá dễ hoặc quá khó
  • Eigenvalue từ phân tích thành phần chính để đánh giá đơn chiều

Phương pháp ước lượng tham số

Việc ước lượng các tham số trong mô hình Rasch là bước quan trọng để chuyển đổi dữ liệu quan sát thành thang đo tuyến tính. Có nhiều phương pháp được sử dụng, trong đó ba phương pháp phổ biến nhất là:

  1. Joint Maximum Likelihood Estimation (JMLE): đồng thời ước lượng cả khả năng của người và độ khó của mục đo, nhưng có thể không hội tụ tốt với mẫu nhỏ.
  2. Conditional Maximum Likelihood (CML): loại bỏ khả năng người khỏi phương trình để ước lượng độ khó độc lập, đảm bảo tính khách quan.
  3. Bayesian Estimation (EB, MCMC): sử dụng phân phối tiên nghiệm để ước lượng tham số khi dữ liệu khan hiếm hoặc không đầy đủ.

Công cụ phổ biến để thực hiện các phương pháp này gồm:

  • Winsteps: giao diện trực quan, phù hợp với nhà nghiên cứu giáo dục
  • R: sử dụng các gói eRm, ltm, TAM
  • ConQuest: hỗ trợ mô hình Rasch đa chiều
  • jMetrik: phần mềm mã nguồn mở hỗ trợ đo lường tâm lý

Phần mềm hỗ trợ phân tích Rasch

Việc áp dụng mô hình Rasch ngày nay trở nên thuận tiện hơn nhờ sự phát triển của nhiều phần mềm thống kê chuyên biệt. Tùy theo trình độ kỹ thuật và mục đích sử dụng, người dùng có thể lựa chọn công cụ phù hợp.

Bảng so sánh một số phần mềm phổ biến:

Tên phần mềm Nền tảng Ưu điểm Hạn chế
Winsteps Windows Thân thiện, hỗ trợ đầy đủ mô hình Rasch Thương mại, không mã nguồn mở
R (gói eRm, ltm) Đa nền tảng Miễn phí, linh hoạt, mở rộng cao Yêu cầu kỹ năng lập trình
ConQuest Windows/Mac Hỗ trợ mô hình đa chiều Cần cú pháp riêng, hơi dốc đường học
jMetrik Đa nền tảng Mã nguồn mở, giao diện đồ họa Hạn chế về khả năng tùy chỉnh mô hình

Việc lựa chọn phần mềm phụ thuộc vào độ phức tạp của mô hình, khối lượng dữ liệu, và nhu cầu phân tích mở rộng (như mô hình đa chiều hoặc dữ liệu phân cấp).

Tài liệu tham khảo

  1. Bond, T.G. & Fox, C.M. (2015). Applying the Rasch Model: Fundamental Measurement in the Human Sciences. Routledge.
  2. Embretson, S.E. & Reise, S.P. (2000). Item Response Theory for Psychologists. Lawrence Erlbaum Associates.
  3. De Ayala, R.J. (2009). The Theory and Practice of Item Response Theory. Guilford Press.
  4. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4440591/
  5. https://www.rasch.org
  6. https://www.winsteps.com
  7. https://jmetrik.org
  8. https://www.conquest.org.au

Các bài báo, nghiên cứu, công bố khoa học về chủ đề mô hình rasch:

Đo Lường Kiến Thức Toán Học Để Giảng Dạy Phân Số Với Các Đơn Vị Được Vẽ Dịch bởi AI
Journal for Research in Mathematics Education - Tập 43 Số 4 - Trang 391-427 - 2012
Nghiên cứu gần đây đã sử dụng các mô hình lý thuyết phản hồi mục truyền thống (IRT) để đo lường kiến thức toán học để giảng dạy (MKT). Một số nghiên cứu (ví dụ: Hill, 2007; Izsák, Orrill, Cohen, & Brown, 2010), tuy nhiên, đã báo cáo những phân nhóm khi đo lường MKT của giáo viên trung học cơ sở, và những nhóm này vi phạm một giả định chính của các mô hình IRT. Nghiên cứu này điều tra t...... hiện toàn bộ
#Kiến thức toán học để giảng dạy #mô hình hỗn hợp Rasch #giáo viên trung học cơ sở #toán học phân số #lý thuyết phản hồi mục
Mô hình Rasch hỗn hợp của Thang đo Tự đánh giá Trầm cảm Dịch bởi AI
Educational and Psychological Measurement - Tập 67 Số 2 - Trang 280-299 - 2007
Trong nghiên cứu này, mô hình Rasch hỗn hợp đã được áp dụng trên Thang đo Tự đánh giá Trầm cảm (SDS), một công cụ đo lường trầm cảm phổ biến, trong một mẫu không phải phương Tây gồm 618 sinh viên đại học Hàn Quốc. Kết quả chỉ ra ba lớp tiềm ẩn và xác nhận tính một chiều của SDS. Thêm vào đó, có một ảnh hưởng đáng kể của giới tính đối với việc tham gia lớp. Những hệ quả cho việc chẩn đoán ...... hiện toàn bộ
#trầm cảm #mô hình Rasch #thang đo tự đánh giá #giới tính #hồ sơ trầm cảm
Áp dụng lấy mẫu Gibbs vào đo lường và đánh giá độ khó câu hỏi trong mô hình Rasch
Tạp chí Khoa học Trường Đại học Sư phạm Thành phố Hồ Chí Minh - Tập 14 Số 4 - Trang 119 - 2019
Trong nghiên cứu này, chúng tôi áp dụng lấy mẫu Gibbs để ước lượng độ khó của các câu hỏi trong mô hình Rasch. Dữ liệu để phân tích được thu thập ngẫu nhiên từ các bài thi cuối kì môn Toán Cao cấp của sinh viên niên Khóa 2014, Trường Đại học Kin...... hiện toàn bộ
#lấy mẫu Gibbs #phương pháp hợp lí cực đại biên (MML) #mô hình Rasch
Khám Phá Nỗi Lo Âu Của Hành Khách Liên Quan Đến Việc Di Chuyển Bằng Tàu Hỏa Dịch bởi AI
Springer Science and Business Media LLC - Tập 37 - Trang 875-896 - 2010
Mặc dù mọi người thường được khuyến khích sử dụng phương tiện giao thông công cộng, nhưng trải nghiệm khi đi lại không phải lúc nào cũng thoải mái. Nghiên cứu này sử dụng các yếu tố dịch vụ để đo lường sự lo âu của hành khách bằng cách áp dụng một mô hình khái niệm dựa trên góc nhìn về chuỗi dịch vụ hành khách đường sắt. Sự lo âu của hành khách liên quan đến việc di chuyển bằng tàu hỏa được đo lườ...... hiện toàn bộ
#sự lo âu của hành khách #di chuyển bằng tàu hỏa #mô hình Rasch #dịch vụ hành khách đường sắt #quy hoạch giao thông
Mô hình Rasch, luật đánh giá so sánh và đo lường phối hợp cộng Dịch bởi AI
Psychometrika - Tập 42 - Trang 631-634 - 1977
Các mối quan hệ giữa mô hình Rasch, luật đánh giá so sánh và đo lường phối hợp cộng được thảo luận. Khoảng cách giữa khả năng của Persona và độ khó của Itemi trong mô hình Rasch là giá trị cơ bản tương ứng với xác suất mà cá nhân a sẽ trả lời đúng cho i, trong đó xác suất này được diễn giải như diện tích dưới một đường cong logistic (cơ bản là tương đương với đường cong chuẩn) và do đó là một ứng ...... hiện toàn bộ
Các Mở Rộng Hiện Đại của Mô Hình Rasch Dịch bởi AI
Springer Science and Business Media LLC - Tập 37 - Trang 263-276 - 2003
Bài báo này sẽ giới thiệu, thảo luận và minh họa hai mở rộng hiện đại của mô hình Rasch: mô hình logistic một tham số (Verhelst và Glas, 1995) và mô hình Rasch đa chiều (Hoijtink và cộng sự, 1999). Sử dụng dữ liệu liên quan đến việc đo lường schizotypy (Vollema và Hoijtink, 2000), những đặc điểm quan trọng nhất của cả hai mô hình sẽ được minh họa. Đối với mô hình logistic một tham số, các đặc điểm...... hiện toàn bộ
#mô hình Rasch #mô hình logistic một tham số #mô hình Rasch đa chiều #schizotypy #phân tích thống kê
Một mô hình Rasch tổng quát cho các yếu tố quan sát Dịch bởi AI
Psychometrika - Tập 56 - Trang 589-600 - 1991
Một mô hình hồi quy logistic được đề xuất để ước lượng mối quan hệ giữa một tập hợp các yếu tố quan sát và một đặc điểm tiềm ẩn được giả định được đo lường bằng một tập hợp các mục nhị phân. Thông thường, các tham số ước lượng của đối tượng trong các mô hình đặc điểm tiềm ẩn có xu hướng bị thiên lệch, đặc biệt là với các bài kiểm tra ngắn. Do đó, mối quan hệ giữa một đặc điểm tiềm ẩn và một tập hợ...... hiện toàn bộ
#hồi quy logistic #mô hình Rasch #đặc điểm tiềm ẩn #dữ liệu nhị phân #tham số ước lượng
Thuộc tính tâm lý của Thang đo Sự hài lòng trong Giải trí (LSS)-phiên bản ngắn: một phương pháp hiệu chỉnh mô hình đánh giá Rasch Dịch bởi AI
BMC Psychology - - 2022
Sự hài lòng trong giải trí là một trong những biến chính để giải thích sự lựa chọn của một cá nhân đối với việc tham gia các hoạt động giải trí và thư giãn. Thang đo Sự hài lòng trong Giải trí (LSS)-phiên bản ngắn đã được sử dụng rộng rãi để đo lường mức độ hài lòng của những người tham gia giải trí và thư giãn. Tuy nhiên, có rất ít nghiên cứu về phiên bản ngắn của LSS đã cung cấp đủ bằng chứng để...... hiện toàn bộ
#sự hài lòng trong giải trí #thang đo sự hài lòng #LSS-phiên bản ngắn #mô hình đánh giá Rasch
Đánh giá tính hợp lệ nội tại của một thang đo an ninh thực phẩm dựa trên khảo sát hộ gia đình được điều chỉnh cho sử dụng tại Iran Dịch bởi AI
Nutrition Journal - Tập 8 - Trang 1-11 - 2009
Tình trạng thiếu an ninh thực phẩm là một chỉ số phản ánh mức độ phúc lợi vật chất trong một khu vực có nhu cầu cơ bản. Mô-đun An ninh Thực phẩm của Hoa Kỳ đã được điều chỉnh để sử dụng trong nhiều bối cảnh văn hóa và ngôn ngữ khác nhau trên toàn thế giới. Chúng tôi đã đánh giá tính hợp lệ nội tại của Thang đo Khảo sát An ninh Thực phẩm Hộ gia đình Hoa Kỳ đã được điều chỉnh để đo lường tình trạng ...... hiện toàn bộ
#an ninh thực phẩm #hợp lệ nội tại #khảo sát hộ gia đình #mô hình Rasch #thiếu an ninh thực phẩm
Hàm sức mạnh của các bài kiểm tra điều kiện của mô hình Rasch Dịch bởi AI
AStA Advances in Statistical Analysis - Tập 99 - Trang 367-378 - 2015
Trong bài báo này, một biểu thức tổng quát của hàm sức mạnh cho các bài kiểm tra điều kiện hoặc giả chính xác của mô hình Rasch được phát derive. Nó cho phép xác định sức mạnh của các bài kiểm tra điều kiện đối với nhiều giả thuyết thay thế khác nhau. Một số ví dụ liên quan thường xảy ra trong thực tiễn được thảo luận. Xét về tính toán, một phương pháp Monte Carlo được gợi ý, cho phép ước lượng sứ...... hiện toàn bộ
Tổng số: 14   
  • 1
  • 2